Scale-up 光互连渗透率
机柜内 GPU-GPU 互联正经历"从 100% 铜缆到光铜混合再到全光"的代际跃迁。Lightcounting 预测 2030E Scale-up 占总光模块市场 21%,TrendForce 预测 CPO 在 AI 数据中心渗透率到 2030 达 35%。这部分需求是从 0 到 1 的全新增量——不替代 Scale-out,而是叠加。
一、机柜内互连演进时间线
gantt
title Scale-up 光互连演进(2020-2030)
dateFormat YYYY
axisFormat %Y
section 全铜时代
100G/通道 铜缆 ~3m :done, 2020, 2024
section 铜光过渡
200G/通道 铜缆 ~1.5m + AOC :active, 2024, 2026
section 光入柜起步
AOC 主导机柜内 :2025, 2028
NPO 量产 :2027, 2030
CPO 早期部署 :2027, 2030
section 全光时代
CPO 主导 :2029, 2032
二、铜缆物理瓶颈:为什么必须光入柜
| 单通道速率 | 铜缆有效距离 | 224G+ 时代影响 |
|---|---|---|
| 100G PAM4 | 3-4 米 | 机柜内全铜可行 |
| 200G PAM4 | 1.5-2 米 | NVL72 已极限 |
| 400G PAM4(224G+ 演进) | <0.5 米 | 必须光互连 |
| 800G/lane | 不可行 | 全光强制 |
核心机理:高速电信号在铜缆上衰减与频率指数级正相关。224G+ SerDes 工作时,单根铜缆有效距离 < 0.5 米——整个机柜的物理跨度都覆盖不了。
三、Nvidia 系统对 Scale-up 的拉动
flowchart LR
A[DGX A100<br/>8 GPU<br/>NVLink 铜] --> B[DGX H100<br/>8 GPU<br/>NVLink 铜]
B --> C[NVL72<br/>72 GPU<br/>铜缆极限 + 部分光]
C --> D[NVL576 Rubin Ultra<br/>576 GPU<br/>必须光互连<br/>600kW Kyber Rack]:::core
D --> E[Feynman NVL1152<br/>2028+<br/>大规模光互连]:::core
classDef core fill:#fef3c7,stroke:#d97706,stroke-width:3px;
NVL576 / Kyber Rack 关键参数
- GPU 数量:576 颗 Rubin Ultra(8 个 NVL72 子机架合并)
- NVLink 域:单一 576-GPU NVLink 域 + 铜光混合直连
- 功率:600 kW(液冷)
- 算力:15 EFLOPS FP4
- 量产时点:2027 H2(Nvidia 公开口径)
- NVLink 7.0 / NVSwitch 7.0:约 144 端口/交换机
Nvidia 2026-04 公开表态:"copper reaches limits, embracing optical scale-up",明确机柜内光互连必经之路。
四、Scale-up 光互连的形态选择
flowchart TB
A[Scale-up 光互连] --> B[AOC 有源光缆<br/>VCSEL 主导<br/>2025-2027 主流]
A --> C[NPO 近封装光学<br/>光引擎离 ASIC 5-10cm<br/>2027 量产]
A --> D[CPO 共封装光学<br/>光引擎集成 ASIC 基板<br/>2027-2028 早期]
A --> E[OBO 板载光学<br/>历史路径]
B --> F[功耗中 / 成熟 / 可热插]
C --> G[功耗低 / 板级更换 / 中际旭创押注]
D --> H[功耗最低 / 良率低 / 博通主推]
E --> I[已被 NPO/CPO 替代]
形态对比
| 形态 | 单 bit 功耗 | 量产难度 | 可维护性 | 关键量产时点 |
|---|---|---|---|---|
| 铜缆 / DAC | 极低(无电光转换) | 低 | 极高 | 224G 后期边缘化 |
| AOC(有源光缆) | 中(VCSEL) | 已量产 | 高 | 2025-2027 主导 Scale-up |
| NPO(近封装) | 较低 | 中(板级耦合) | 中 | 2027 量产 |
| CPO(共封装) | 最低 | 高(与 ASIC 同寿命) | 低 | 2027-2028 早期 |
五、渗透率预测:2025 → 2030
| 年份 | Scale-up 占总光模块 | NPO 占 Scale-up | CPO 占 Scale-up | 关键事件 |
|---|---|---|---|---|
| 2025 | <3% | 0%(在研) | 0%(在研) | AOC 主导 |
| 2026 | ~5% | 早期样品 | 早期样品 | NPO 客户验证 |
| 2027 | ~10% | 量产元年 | 早期部署 | NVL576 上线 |
| 2028 | ~15% | 快速放量 | 加速渗透 | 3.2T 量产 |
| 2029 | ~18% | 持续扩大 | 大规模 | Feynman 平台引入 |
| 2030 | ~21%(Lightcounting) | 重要选型 | AI 数据中心 35%(TrendForce) | 全光机柜成型 |
CPO 市场规模爆发
TrendForce 数据:CPO 市场 2024 年 0.46 亿美元 → 2030 年 81 亿美元,CAGR 137%——任何细分赛道少有的数量级增长。
六、A 股受益玩家深度分布
| 公司 | 卡位环节 | 量产 / 储备节点 |
|---|---|---|
| 中际旭创 | NPO / CPO 整机 | 已获 NPO 客户订单指引,2027 量产 |
| 新易盛 | 1.6T + NPO 跟进 | 硅光 + DSP 平台 |
| 光迅科技 | 自研光芯片 + NPO/CPO/ELS | 央企垂直一体化 |
| 天孚通信 | FAU / 微透镜 / 光引擎封装 | NPO 时代价值量上行 3-5 倍 |
| 罗博特科 | NPO/CPO 自动化封测设备 | ficonTEC 收购 / OFC 2026 展示 |
| 炬光科技 | OCS/CPO/NPO 微光学元件 | V 槽 FAU / 一体化耦合透镜 |
| 华懋科技 | 中科智星 24.5%,晶圆级封装 | NPO/CPO 布局早期 |
| 长光华芯 | VCSEL + EML 上游 | 800G AOC 主流光源 |
| 源杰科技 | CW 光源配套 | NPO 大规模光端口拉动 CW 需求 |
七、关键投研议题
议题 1:21% 是 0 到 1 的纯增量
Scale-up 光互连不替代 Scale-out——是 AI 集群规模扩大叠加新增的需求层。Lightcounting 21% 预测意味着2030 年总光模块市场约 ⅕ 来自这个全新增量。
议题 2:NPO vs CPO 的路线选型未决
中际旭创押注 NPO 路线(板级独立光引擎),博通主推 CPO(与 ASIC 共封装)。Nvidia NVL576 的最终选型(NPO 还是 CPO)是 2026-2027 行业最大不确定性。一旦定型,对应路线的供应商将获得超额收益。
议题 3:CPO 良率与可维护性是商用化前提
CPO 与 ASIC 共寿命——一颗光引擎损坏需更换整个 ASIC 模组。这对 AI 数据中心运维成本是严峻挑战。NPO 在维护性上的优势(板级独立更换)可能让其在 2027-2030 占据主导而非 CPO。
议题 4:天孚 / 罗博特科是 NPO 时代隐形龙头
NPO/CPO 时代光模块整机厂的价值量比可插拔时代下降,但 FAU 阵列 / 微透镜 / 自动化封测设备的价值量大幅上升——天孚通信、罗博特科是深度受益的"卖铲人"。
八、跟踪指标
| 指标 | 频率 | 信号意义 |
|---|---|---|
| Nvidia NVL576 量产时点 | 半年 | Scale-up 光互连规模化锚点 |
| 中际旭创 NPO 客户定量订单 | 季度 | NPO 商用化关键节点 |
| CPO 量产良率公开口径 | 半年 | CPO 商用化可行性 |
| 天孚通信 / 罗博特科 季度营收 | 季度 | 光引擎封装价值量验证 |
| AOC vs NPO 在 Scale-up 份额 | 半年 | 形态竞争结果 |
| Nvidia GTC 路线图更新 | 年度 | NPO/CPO 选型确定 |